目标识别作为规划(Ram´ırez 和 Geffner 2009;Ram´ırez 和 Geffner 2010)的任务是从给定一系列观察、初始状态和观察下的代理的行为模型的一组假设中识别实际目标。目标识别作为规划的方法利用高效的规划技术和启发式信息来开发越来越准确和更快的目标识别方法。大多数方法根据比较最佳计划的成本和受约束以遵守或避免观察的计划的成本的指标来选择目标。这些方法在计算或近似这些成本的方式上有所不同。虽然有些方法使用规划器计算这些成本(Ram'ırez 和 Geffner 2009;Ram'ırez 和 Geffner 2010),但其他方法使用启发式函数的复杂结构来近似它们(E-Mart'ın、R.-Moreno 和 Smith 2015;Vered 等人2018),或者尝试通过在动作描述中引入权重来明确应对缺失和嘈杂的观察(Sohrabi、Riabov 和 Udrea 2016)。相比之下,最近的研究(Pereira、Oren 和 Meneguzzi 2017)引入了识别启发式方法,使用来自规划实例结构的信息来从一组目标假设和观察中识别实际目标。他们都试图平衡速度
主要关键词